AI资讯新闻榜单内容搜索-Scaling La

GPT-5暴写「屎山代码」！14个Prompt，看穿GPT-1到GPT-5七年智商进化史

GPT-5发布半月，却被连连吐槽。如今，一张基准与GPT-4对比基准测试图，证明了Scaling Law没有撞墙。七年间，从GPT-1到GPT-5十四个花式Prompt对决，实力差一目了然。

来自主题: AI资讯

8634 点击 2025-08-20 11:38

蛋白质基座的GPT时代来了？！

蛋白质模型的GPT时刻来了！清华大学智能产业研究院（AIR）周浩副教授课题组联合上海人工智能实验室发布了AMix-1：首次以Scaling Law、Emergent Ability、In-Context Learning和Test-time Scaling的系统化方法论来构建蛋白质基座模型。

来自主题: AI技术研报

7230 点击 2025-08-10 16:00

Meta华人新秀毕树超，重磅爆料下一代LLM路线！RL+预训练直通AGI

OpenAI前研究员、Meta「AI梦之队员」毕书超在哥大指出：AGI就在眼前，突破需高质数据、好奇驱动探索与高效算法；Scaling Law依旧有效，规模决定智能，终身学习才是重点。

来自主题: AI资讯

7234 点击 2025-08-05 12:58

GPT-5真身曝光，首测编程惊艳全网！一句话秒生游戏，OpenAI双雄备战AGI

GPT-5更近了！今天，神秘模型Horizon Alpha火遍全网，编码首测性能逆天，各种三方基准实测相继放出。就在发布前夕，OpenAI核心大脑专访坦言模型还有瓶颈，但坚信Scaling Law没有尽头。

来自主题: AI资讯

6837 点击 2025-08-01 16:44

一个“蠢问题”改写模型规则！Anthropic联创亲曝：瞄准Claude 5开发爆款应用，最强模型的价值会让人忽略成本负担

Anthropic 联合创始人 Jared Kaplan 是一名理论物理学家，研究兴趣广泛，涉及有效场论、粒子物理、宇宙学、散射振幅以及共形场论等。过去几年，他还与物理学家、计算机科学家们合作开展机器学习研究，包括神经模型以及 GPT-3 语言模型的 Scaling Law。

来自主题: AI资讯

7547 点击 2025-07-31 11:05

亿级短视频数据突破具身智能Scaling Law！Being-H0提出VLA训练新范式

如何让机器人从看懂世界，到理解意图，再到做出动作，是具身智能领域当下最受关注的技术重点。但真机数据的匮乏，正在使对应的视觉-语言-动作（VLA）模型面临发展瓶颈。

来自主题: AI资讯

6741 点击 2025-07-25 10:07

OpenAI去年挖的坑填上了！奖励模型首现Scaling Law，1.8B给70B巨兽上了一课

最近，一款全新的奖励模型「POLAR」横空出世。它开创性地采用了对比学习范式，通过衡量模型回复与参考答案的「距离」来给出精细分数。不仅摆脱了对海量人工标注的依赖，更展现出强大的Scaling潜力，让小模型也能超越规模大数十倍的对手。

来自主题: AI技术研报

7320 点击 2025-07-11 16:30

Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率，华为诺亚提出代码HLCE终极基准

大语言模型（LLM）在标准编程基准测试（如 HumanEval,Livecodebench）上已经接近 “毕业”，但这是否意味着它们已经掌握了人类顶尖水平的复杂推理和编程能力？

来自主题: AI技术研报

7458 点击 2025-07-07 10:39

原来Scaling Law还能被优化？Meta这招省token又提效

2017 年，一篇《Attention Is All You Need》论文成为 AI 发展的一个重要分水岭，其中提出的 Transformer 依然是现今主流语言模型的基础范式。尤其是在基于 Transformer 的语言模型的 Scaling Law 得到实验验证后，AI 领域的发展更是进入了快车道。

来自主题: AI技术研报

7204 点击 2025-07-06 14:56

Meta-Think ≠ 记套路，多智能体强化学习解锁大模型元思考泛化

最近，关于大模型推理的测试时间扩展（Test time scaling law ）的探索不断涌现出新的范式，包括① 结构化搜索结（如 MCTS），② 过程奖励模型（Process Reward Model ）+ PPO，③ 可验证奖励（Verifiable Reward）+ GRPO（DeepSeek R1）。

来自主题: AI技术研报

8465 点击 2025-07-04 09:44